学 影像 诊断 、 


智慧 中 医 


司 智慧 中 医 ; 深 度 学 习 


作为 人 工 智能 化 的 支撑 技术 ， 
es 依 断 任务 中 表 


采 度 委 习 已 经 在 


: 肺癌 处 方 智和 


恶性 肿瘤 历史 悠久 ， 拥 有 独特 的 理论 体系 和 确 
阮 春 阳 裴 朝 翰 张 彦 春 杨 草 田 建 辉 


色 ， 发 挥 着 重要 作用 。 深 度 学 习 方法 成 熟 2 
ee onan 支持 向 量 


出 ， 


ar 
[等 是 


任务 的 主要 支撑 方法 ， 该 类 方法 通过 特 


0 


集 上 表现 出 色 。 与 此 同时 ， 随 着 中 


[lll 
mn 


Ra di 
佳 化 和 客观 化 发 挥 了 


、 促 进 中 医 诊断 的 标 ; 


其 是 小 
医 信息 化 发 
和 毒性 等 


下 首 人 六 出 是 学 避 短 活 因 和 


始 数据 上 进行 特征 选择 不 同 ， 深 度 学 : 


灵 次 的 表示 学 习 算法 ， 可 以 从 
， 并 且 逐 层 将 低层 次 的 表示 抽象 为 更 高 


原始 数 提 


需要 专家 在 原 


作为 
自动 


应 用 尚 处 于 起 步 状态 ， 主 要 是 通过 深度 卷 积 
俐 床 舌 诊 ，CT 图 像 数 据 进行 分 类 中。 
宋 度 学 习 模 型 构建 智慧 诊断 模式 3 
医 诊断 过 程 中 ， 达 到 加 
FP 医 人 工 智能 研究 中 一 项 重要 课题 

医 临床 诊断 是 一 种 个 性 化 医疗 模式 。 
E 电 出 病 证 ， 基 于 可 能 的 病 六 
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生成 模型 


切 的 治疗 效果 。 特 别 是 近 半 个 世纪 来 ， 开 展 的 多 项 


i 医 结合 治疗 肿瘤 的 临床 研究 ， 证 实 


。 中 医 诊断 肺癌 ， 首 先 通 过 “ 望 ” 


“ 问 ”“ 切 ”获取 患者 的 症状 和 体征 ， 根 


判定 患者 的 证 型 ， 最 后 根据 病变 的 具体 部 


表示 中。 深度 学 习 已 经 在 拥有 丰富 数 据 集 的 
俐 床 诊断 任务 中 得 到 了 一 定 程度 的 有 效应 用 ， 
于 深度 学 习 的 新 药 发 现 让 ， 电 子 病历 诊断 预 
。 通过 文献 调研 ， 深 度 学 习 模型 在 中 医 诊断 


如 


断 智能 化 提 


约 为 78.7 万 例 ， 
57.13/10 万 ，45.80/10 万 人 。 在 我 


加 


2 ”中医 肺癌 临床 诊断 
国 恶性 肿瘤 发 病 率 中 ， 肺 癌 发 病 率 居 高 不 


杂 的 映射 关系 。 图 1 展示 了 实际 的 中 医 
床 数 据 和 其 中 复杂 关系 模式 。 如 何 准 确 的 去 模拟 
i 
出 了 挑战 。 针 对 以 上 挑战 ， 本 文 探讨 
兴 深 度 学 习 模 型 构建 智慧 中 


诊断 模式 给 


。 据 国家 癌症 中 心 统计 显示 ，2018 重 


和 其 应 


助 临床 的 作用 ， 


医生 根 
E 医 生 做 
给 出 相应 的 针对 症状 的 中 药 。 因 此 ， 
医 诊断 数据 的 各 项 特征 十 分 复杂 。 例 如 ， 中 药 之 
间 存 在 协同 关系 和 多 重 共 线 性 关系 ， 中 药 和 症状 


FP 医 


FE 我 国 新 发 肺 


发 病 率 和 死亡 率 分 别 达到 


E 型 选 定 一 个 主 方 ， 并 在 此 基础 上 进行 中 药 


医 临床 病历 样 例 ，(b) 中 医 病历 复杂 模 


会 以 文本 形式 记录 并 形成 处 方 。 现 代 


， 疾 病 拥有 标准 化 的 诊断 和 治疗 规范 ， 
患者 的 治疗 更 具有 个 体 化 特征 ， 处 方 
与 医生 的 临床 水 平 具有 强 相 关 性 。 中 医 临 
A ee es 


生 问题 的 分 析 和 求解 ， 这 正 是 医 


生 济 证 施 治 的 精华 1。 基 于 以 上 中 医用 
用 ， 如 何 利 用 处 方 数据 挖掘 其 中 用 药 等 规 


= 
= 


癌 临 床 诊断 


智能 处 方 生 成 系统 辅助 临床 诊断 ， 对 中 


医 传承 与 创新 发 展 具有 深远 意义 。 目 前 ， 由 于 中 医 
处 方 却 少 数字 化 和 标准 化 ， 人 工 智 能 技术 在 其 上 


分 析 ， 针 对 其 数据 特点 ， 构 建 深 度 学 习 模型 挖掘 
Pp 药 之 间 隐 藏 关系 等 规律 ， 在 此 过 


的 应 用 十 分 有 限 。 本 文 在 中 医 知识 文本 挖掘 工作 积 


， 对 中 医 肺癌 临床 处 方 数据 调 下 


医生 沟通 验证 模型 的 准确 性 ， 最 终 实现 处 


国 


医药 治疗 


达到 较 高 的 临床 有 效 性 ， 辅 助 医生 
入 床 效率 ， 推 动 临床 诊断 创新 发 展 。 图 
述 了 本 文 整体 本 而 构建 思路 . 

3 ”基于 循环 神经 网 络 的 肺癌 处 方 智能 生成 
循环 神经 网 络 RNN 是 一 种 特殊 的 神经 网 络 结构 ， 
昌 “ 人 类 认 知 是 基于 过 往 的 经 验 和 记忆 ?” 
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这 一 观点 提出 的 。 不 同 于 一 般 深度 网 络 ，RNN 不 仅 
考虑 前 一 时 刻 的 输入 ,而 且 赋 予 了 网 络 对 前 面 输入 
内 容 的 一 种 “记忆 ' 功 能 。RNN 之 所 以 称 为 循环 神 


经 网 络 ， 是 因为 一 个 序列 当前 的 输出 与 前 面 的 输 
出 也 有 关 。 


图 2 模型 构建 思路 


人体 的 表现 形式 为 网 络 会 对 前 面 的 信息 进行 记忆 
并 应 用 于 当前 输出 的 计算 中 ， 即 隐藏 层 之 间 的 节 
点 不 再 无 连接 而 是 有 连接 的 ， 并 且 隐 藏 层 的 输入 
不 仅 包 括 输入 层 的 输出 还 包括 上 一 时 刻 隐藏 层 的 
输出 。 
本 文 将 中 医 临 床 处 方 的 生成 过 程 建 模 为 一 个 
机 器 翻译 的 问题 ， 输 入 的 是 一 组 症状 序列 ， 输 出 
的 是 处 方 需要 的 草药 组 合 ， 就 像 将 一 组 由 中 文 词 
汇 组 成 的 句子 翻译 成 英文 一 样 。 而 循环 神经 网 络 
RNN 非常 适合 处 理 这 种 序列 与 序列 之 间 的 翻译 问题 ， 


图 3 就 描述 了 一 个 简单 的 自 编码 -解码 模型 器 结构 。 
利用 自 编码 器 ， 本 文 将 一 组 中 文 词语 序列 ， 比 如 
一 组 症状 按照 次 序 依 次 输入 编码 器 ， 利 用 编码 器 
将 该 组 序列 压缩 成 一 个 向 量 元 素 ， 及 就 是 将 一 组 
症状 聚合 ， 得 到 症状 组 的 压缩 表示 ， 这 种 压缩 的 
症状 表示 是 提取 了 症状 序列 中 关键 的 特征 信息 。 随 
后 ， 本 文 将 得 到 输入 序列 的 压缩 表示 输入 到 解码 
器 中 ， 基 于 处 方 数据 标签 ， 解 码 器 会 将 本 文 需要 
的 输出 序列 元 素 ， 也 就 是 草药 依次 解码 出 来 。 到 此 ， 
本 文 给 出 了 处 方 生 成 的 基本 思路 和 模型 框架 。 但 是 ， 
编码 器 -解码 器 仅仅 是 一 个 抽象 的 模型 框架 ， 它 们 
内 部 的 具体 实现 可 以 有 许多 种 ， 但 是 在 本 文 的 中 
医 处 方 生 成 任务 中 ， 比 较 适合 的 还 是 前 面 提 到 的 
循环 神经 网 络 RNN。 因 为 RNN 具有 的 记忆 功能 ， 这 
一 特性 使 编码 器 在 一 个 一 个 输入 症状 ， 对 齐 进行 
压缩 的 时 候 ， 输 出 的 中 间 压 缩 向 量 表示 可 以 对 前 
和 输入 的 症状 有 “记忆 ”。 在 输出 的 时 候 ， 按 照 它 
所 “记忆 ”的 内 容 进行 针对 性 的 解码 出 需要 的 中 
药 。 
注意 力 (attention〉 机制 

在 实际 模型 运行 中 ， 基 于 RNN 的 自 编码 器 处 
理 一 般 文本 序列 数据 已 经 取得 了 明显 效果 ， 但 中 
医 处 方 数据 不 同 于 一 般 的 中 文 数据 有 序 的 组 织 形 
式 ， 处 方 中 症 状 、 中 药 完 全 是 无 序 的 组 织 。 基 于 
RNN 的 自 编码 器 在 生成 处 方 过 程 中 会 表现 出 了 不 
足 。 如 果 利用 循环 神经 网 络 RNN 作为 其 基本 组 件 ， 
虽然 RNN 有 一 定 的 记忆 能 力 ， 但 是 它 还 是 随 着 距 
离 衰减 。 拿 中 医 症状 来 说 ， 本 文 得 到 的 症状 压缩 表 


已 在 自然 语言 处 理 的 机 器 翻译 方面 有 着 广泛 的 运 
和 ， 所 以 本 文 可 以 在 中 医 的 处 方 生成 问题 上 借鉴 
己 有 的 机 器 翻译 的 经 验 ， 来 推陈出新 ， 构 建 符合 
中 医 临 床 处 方 数 据 特点 的 智能 处 方 生成 系统 。 
编码 器 -解码 器 模型 

针对 将 一 个 输入 序列 翻译 成 输出 序列 的 问题 ， 
人 提出 了 编码 器 -解码 嚣 模型， 所谓 编码 ， 就 是 
将 输入 序列 转化 成 一 个 固定 长 度 的 向 量 ;， 解码 ， 


就 是 将 之 前 生成 的 固定 向 量 再 转化 成 输出 序列 


[109] 


图 3 ““ 症 状 - 中 药 ”” 自 编码 -解码 器 模型 


示 是 在 输入 最 后 一 个 症状 之 后 才 生 成 的 ， 所 以 它 
必然 对 离 她 比较 近 的 症状 “记忆 ”的 比较 多 ， 离 
它 远 的 ， 比 如 第 一 个 输入 的 症状 ， 压 缩 表示 所 
“记忆 ”的 信息 就 比较 少 了 。 
针对 这 种 问题 ， 本 文采 用 用 RNN 的 一 些 修 正 
模型 比如 长 短 时 记忆 网 络 (LSTM) ， 门 控 循 环 单 
元 CGRU) ， 代 蔡 简 单 RNN 作为 基本 的 编码 器 - 
解码 器 组 件 。 利 用 RNN 的 改进 形式 虽然 可 以 一 定 
程度 上 解决 在 编码 过 程 中 的 “遗忘 ”问题 。 但 是 就 
这 个 编码 -解码 过 程 而 言 ， 有 一 个 基本 的 逻辑 缺陷 。 
本 文 在 将 一 组 中 医 症状 压缩 表示 之 后 ， 在 利 
用 其 解码 出 来 草药 的 过 程 中 ， 每 次 解码 利用 的 都 
是 同一 个 压缩 表示 ， 但 是 这 样 是 有 悖 于 正常 的 思 
考 模 式 的 。 举 例 来 说 ， 医 生 在 开 出 某 种 中 药 的 时 候 ， 
不 可 能 平均 地 考虑 所 有 的 症状 ， 必然 是 有 所 侧重 
于 某 些 症状 ， 也 就 是 说 会 专门 地 注意 某 种 或 某 些 


T 


薄 
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症状 而 不 是 对 所 有 的 症状 分 配 相 同 的 注意 力 。 依 据 
这 种 思路 ， 就 自然 地 引入 了 注意 力 (attention) 机 
制 王 9 。 

在 本 文 之 前 的 模型 里 ， 症 状 的 压缩 表示 ， 在 
编码 过 程 结束 之 后 就 再 也 不 会 改变 了 ， 也 就 是 说 
本 文 在 解码 中 药 过 程 中 ， 每 次 对 于 之 前 症状 的 考 


虑 ， 或 者 是 分 配 的 注意 力 是 相同 的 ， 这 种 情况 明 mm. 才 h， 
显 是 不 现实 的 。 本 文 的 注意 力 机 制 ， 来 源 于 一 种 对 | | [| | fs 
hi pa hz hs ht 
人 类 思考 模式 的 模仿 。 在 注意 力 机 制 的 实现 层面 ， mh ce 抽 
本 文 在 解码 的 过 程 中 将 不 变 的 总 体 症 状 压缩 表示 ， 
蔡 换 成 可 变 的 每 个 症状 压缩 表示 的 加 权 和 。 在 循环 图 5 ““ 症 状 - 中 药 ”” 双 向 RNN 
神经 网 络 里 ， 每 输入 一 个 症状 其 实 就 可 以 产生 一 掩盖 (mask) 和 履 盖 〈coverage) 机制 
个 压缩 表示 ， 它 表示 的 是 包含 这 个 症状 以 及 前 面 本 文 结合 医生 诊断 的 思考 过 程 来 分 析 ， 会 形 
距离 比较 近 的 症状 的 大 部 分 信息 ， 所 以 本 文 没 有 成 这 样 一 种 思路 ， 之 前 已 经 生成 的 中 药 在 生成 下 
必要 采用 等 所 有 症状 都 输入 完成 之 后 所 得 到 的 压 一 种 中 药 的 时 候 绝对 不 会 再 考虑 ， 已 经 考虑 过 并 
缩 ， 而 利用 在 输入 每 个 症状 时 产生 的 压缩 。 他 们 带 且 已 经 针对 性 的 开 出 了 中 药 的 症状 ， 在 接 下 来 的 
种 局 部 性 的 信息 ， 本 文 可 以 将 他 们 加 权 求 和 ， 思考 中 必然 不 会 再 优先 考虑 。 类 似 思 路 在 自然 语言 
在 本 文 需要 重点 考虑 某 些 局 部 症状 的 时 候 ， 这 些 处 理 里 面 的 统计 翻译 方向 里 很 早 就 有 应 用 ， 近 些 
局 部 症状 对 应 的 压缩 的 权重 就 可 以 适当 上 调 。 年 来 随 着 深度 学 习 的 发 展 ， 很 多 研究 者 将 这 种 思 
总 之 ， 本 文 解码 不 同 中 药 所 依据 的 症状 压缩 路 应 用 到 了 神经 网 络 之 中 ， 比 如 李 航 等 人 提出 的 


不 再 都 是 相同 的 一 个 ， 而 是 根据 不 同 中 药 的 情况 ， | 覆盖 机 制 "9。 北 京 大 学 的 李 炜 0 名 等 人 结合 了 李 航 
由 每 个 症状 的 压缩 在 乘 上 实际 考虑 的 不 同 权重 求 的 方法 ， 将 其 应 用 到 了 中 医 处 方 生成 模型 上 。 
和 而 得 的 新 的 症状 压缩 表示 。 这 就 是 本 文 所 说 的 注 本 文 首先 看 输出 中 药 的 方面 ， 中 医 处 方 和 机 
意 力 机 制 。 图 4 是 加 入 注意 力 机 制 的 自 编码 器 模型 。 ”器 翻译 的 一 个 明显 不 同 就 是 ， 在 机 器 翻译 出 来 的 
个 句子 里 ， 同 一 个 词 是 可 以 出 现 多 次 的 ， 但 是 
“全 @@G@ 在 hr 攻 处 万 里 面 ,同一 种 药 是 不 能 出 现 许多 次 的 。 
所 以 一 个 最 简单 的 想法 就 是 直接 将 已 经 生成 的 中 
ss = 药 的 概率 永远 设 为 0。 这 个 想法 虽然 很 粗暴 但 是 实 
a rT @ 6 人 际 的 效果 非常 不 错 ， 木 文 将 这 种 机 制 成 为 掩盖 
图 4 ““ 症 状 -中 药 ”” 注 意 力 机 制 自 编码 器 模型 ” 。” (mask) 它 在 每 次 生成 一 种 中 药 之 后 ， 用 掩 码 永 
远 地 将 这 种 中 药 概率 设 为 0。 其 次 是 在 输入 症状 的 
另外 ， 在 本 文 获取 每 个 症状 的 局 部 压缩 表示 的 时 方面 ， 在 机 器 翻译 的 过 程 中 ， 会 存在 对 某 些 输入 
候 ， 仅 仅 是 获取 了 这 个 症状 之 前 包含 这 个 症状 的 的 词 过 度 翻译 的 情况 ， 就 是 对 同一 个 词 生成 了 一 
信息 ， 而 不 包含 之 后 输入 症状 的 信息 。 所 以 本 文 可 “个 翻译 之 后 又 生成 了 一 个 翻译 ， 就 原始 的 编码 解 


以 把 输入 症状 的 顺序 变换 一 下 ， 从 后 往 前 输入 ， 码 模型 来 说 ， 很 难 做 到 一 种 “症状 -中 药 ” 一 一 对 
这 样本 文 就 可 以 获得 每 个 症状 及 其 按照 原始 顺序 应 的 情况 ， 反 映 在 处 方 生成 问题 上 就 是 ， 对 于 同 
来 看 之 后 的 症状 的 信息 ， 本 文 将 其 称 之 为 反 向 的 一 种 症状 ， 反复 生成 针对 性 的 中 药 ， 因 为 治疗 某 
压缩 表示 。 本 文 将 正 向 和 反 向 的 压缩 表示 结合 起 来 ， ”一 种 症状 的 中 药 可 能 不 止 一 种 ， 相 当 于 过 度 治 疗 。 
可 以 代表 某 个 输入 症状 前 面 和 后 面 一 段 距离 的 局 与 此 相对 的 是 从 翻译 的 情况 ， 就 是 某 些 词 始终 没 
部 情况 ， 这 比 本 文 前 面 提 到 的 单 向 的 方式 能 包含 有 翻译 ， 某 些 症状 始终 没有 开 出 对 应 的 药 。 这 种 过 


更 多 的 信息 。 图 5 是 双向 循环 网 络 模型 的 一 个 运行 翻译 和 从 翻译 的 情况 对 于 生成 处 方 的 质量 产生 了 
模式 示例 。 十 分 巨大 的 影响 ， 无 法 满足 临床 诊断 需求 。 
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前 GPU 性 能 大 幅 提 升 的 硬件 进步 背景 ,第 二 ， 传 统 
循环 神经 网 络 模型 有 一 个 明显 的 缺点 就 是 对 于 输 
入 的 顺序 很 敏感 ， 这 在 翻译 问题 中 是 必要 的 ， 但 
是 在 中 医 处 方 生成 方面 就 显得 画蛇添足 了 ， 根 据 
本 文 的 测试 ， 同 样 的 一 组 症状 输入 进去 ， 如 果 输 
入 的 顺序 与 训练 模型 时 症状 输入 的 顺序 有 明显 的 
差异 ， 那 么 输出 的 中 药 处 方 质 量 会 很 差 。 在 中 医 临 
床 诊断 过 程 中 ， 处 方 的 症状 都 是 医生 根据 个 人 习 
图 6 “症状 -中 药 ” 结 合 履 盖 机 制 与 注意 力 机 制 的 惯 书写 出 来 的 ， We 


| 自 编码 器 模型 感 的 话 ， 进 行 实际 临床 应 用 推广 会 受到 很 大 限制 。 
针对 以 上 问 ee transformer 和 每 症状 种 

针对 这 种 问题 ， 在 早期 的 统计 翻译 研究 里 面 ， 类 和 顺序 分 开 用 两 个 模块 来 考虑 ， 通 过 修改 测试 ， 

究 人 员 给 每 个 词 添加 了 一 个 计数 器 ， 来 记录 其 翻 尝试 去 除 处 理 输入 症状 顺序 的 模块 ， 再 将 输入 测 


译 情况 。 在 现在 的 深度 学 习 方 法 中 ， 许 多 研究 者 给 试 的 症状 给 打 乱 ， 发 现 乱 序 和 正 序 效果 并 没有 明 

出 了 更 加 精细 的 解决 方法 。 李 航 等 上 2 在 一 般 模 型 显 差别 ， 这 个 结果 就 说 明 transformer 模型 比 基 于 
里 添加 了 一 种 覆盖 〈coverage) 向 量 ， 将 其 与 前 画 循环 神经 网 络 的 编码 器 -解码 器 模型 更 适用 于 中 医 
提 到 的 注意 力 〈attention) 机 制 结合 。 如 图 6 所 示 ， 处 方 的 生成 。 第 三 ， 因 为 transformer 模型 对 于 编 
其 具体 是 在 上 文 提 到 的 局 部 症状 压缩 表示 的 加 权 码 完全 就 是 几 个 矩阵 相 乘 的 运算 ， 其 中 的 中 间 产 

和 上 再 加 一 个 修饰 向 量 ， 这 个 修饰 向 量 会 根据 当 物 就 是 本 文 之 前 说 的 类 似 于 局 部 向 量 压缩 表示 的 

前 已 经 考虑 过 的 症状 情况 ， 适 当 增加 或 降低 某 个 权重 系数 ， 本 文 可 以 从 程序 里 面 讲 这 个 权重 系数 

局 部 症状 压缩 表示 的 权重 。 本 文 最 终 解码 某 种 中 药 和 矩阵 提取 出 来 ， 可 以 随时 的 看 到 在 生成 哪些 药 的 

所 应 用 的 是 前 面 所 有 局 部 症状 压缩 表示 的 加 权 和 ， 时 候 ， 哪 些 症 状 被 着 重 考虑 了 。 

其 权重 就 是 注意 力 机 制 所 要 计算 的 代表 每 个 症状 
重视 程度 的 系数 。 而 本 文 的 覆盖 向 量 ， 就 是 结合 2 
前 生成 中 药 情况 ， 比 如 本 文 之 前 生成 的 中 药 是 针 
对 某 些 症状 的 ， 那 么 覆盖 向 量 就 会 把 这 些 症状 的 
局 部 压缩 权重 调 低 ， 反 之 就 调 高 。 在 实际 操作 中 ， 

5 


ossa25 


研究 者 主要 提出 了 两 个 具体 实现 ， 第 一 个 是 从 具 
体 的 语言 学 角度 ， 有 具有 可 解释 性 ， 但 是 比较 复杂 。 
第 二 个 是 从 神经 网 络 的 角度 ， 比 较 易 于 实现 ， 在 
李 炜 等 人 模型 里 采用 第 二 种 。 
4 基于 transformer 的 肺癌 处 方 智能 生成 
2017 年 ， 谷 歌 提 出 transformer 模型 031， 该 模 
型 直接 采用 本 文 之 前 提 到 的 attention 模型 来 作为 
编码 器 -解码 器 的 基本 组 件 。 谷 歌 在 一 系列 都 后 续 丰 图 7“ 症状 -药物 ”关系 热 图 
究 中 ， 利 用 这 篇 论文 提出 的 模型 刷新 了 很 多 自然 
语言 处 理 任务 的 记录 ， 为 提升 模型 的 性 能 ， 本 文 第 三 ， 因 为 transformer 模型 对 于 编码 完全 就 是 几 
引入 transformer 代 栓 传统 RNN 作为 编码 模块 。 个 矩阵 相 乘 的 运算 ， 其 中 的 中 间 产 物 就 是 本 文 之 
本 文 构 建 该 模型 的 基本 思路 是 利用 注意 力 机 前 说 的 类 似 于 局 部 向 量 压缩 表示 的 权重 系数 ， 本 
制 attention 模型 完全 蔡 代 了 循环 神经 网 络 的 方法 。 文 可 以 从 程序 里 面 讲 这 个 权重 系数 矩阵 提取 出 来 ， 
解决 了 RNN 实际 运行 中 的 缺陷 ， 第 一 ， 循 环 神经 可 以 随时 的 看 到 在 生成 哪些 药 的 时 候 ， 哪 些 症状 
网 络 的 一 个 很 严重 问题 是 无 法 并 行 化 ， 输 入 必须 被 着 重 考虑 了 。 简单 来 说 ， 就 是 transformer 模型 对 
一 个 接着 一 个 ， 然 而 attention 把 串 行 的 输入 ， 变 于 中 医 处 方 的 生成 任务 有 着 很 好 的 解释 性 。 这 在 
成 了 一 次 性 的 几 个 矩阵 相 乘 的 运算 ， 非 常 适合 前 的 深度 学 习 科 研 里 面 是 很 重要 的 ， 因 为 很 多 深 


oss550 


sss0g 
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度 学 习 模 型 最 大 的 问题 就 是 不 知道 程序 里 面 是 怎 
么 起 作用 的 ， 仅 仅 是 知 


其 然而 不 是 知 其 所 以 然 。 图 


6 是 利用 基于 transformer 的 处 方 生成 模型 运行 过 程 


中 提取 出 来 的 某 个 注 


FE 意 力 权重 系数 矩阵 画 出 的 


“症状 -中 药 ”” 热 
transformer 的 处 方 


图 7 实例 说 明了 基于 


E 成 模型 方法 能 一 定 程度 的 准确 
反映 实际 的 ““ 症 状 -中 药 ”” 关 系 ， 提 升 了 模型 


性 能 。 同 时 ， 我 们 分 别 利用 基于 RNN 的 处 方 生成 
模型 和 基于 transformer 的 处 方 生成 模型 生成 肺癌 
处 方 ， 进 行 专家 评估 。 本 文 邀 请 了 上 海中 医药 大 学 


附属 龙华 医院 两 
医师 来 对 模型 
全 国 最 早 开 阵 中 


六 专门 从 事 肺 癌 中 医 诊治 的 主治 
结果 打分 。 上 海 市 龙华 医院 肿瘤 科 是 
医药 和 中 西医 结合 治疗 肿瘤 的 专 


科 之 一 ， 是 加 


创建 以 来 在 国 


首倡 扶正 法 治疗 恶性 用 
的 中 医药 治疗 恶 怕 
医师 均 有 10 年 以 上 的 | 
处 方 系统 生成 的 处 方 ; 
间 ， 与 模型 性 


P 医 临床 研究 基地 《恶性 肿瘤 ) ， 
医大 师 刘 嘉 湘 教授 带领 下 ， 在 国内 
和 瘤 ， 总 结 了 一 套 行 之 有 部 
肿瘤 的 中 医 诊 疗 体系 睛 ])， 两 位 
临床 经 验 ， 请 他 们 针对 智能 


行 打分 ， 分 数 在 0-10 分 之 
[ 比 不 同 ， 专 家 的 评估 在 一 


定 程 度 上 更 合理 ， 


transformer 的 处 方 和 


效率 。 
5 总 结 


贴近 临床 ， 两 位 位 专家 最 终 
对 基于 RNN 的 处 方 生成 模型 评分 为 7 分 ， 对 基于 
E 成 模型 评分 为 8.5 分 ， 从 专家 
评判 的 结果 来 看 ， 基 于 transformer 的 处 方 生成 模 


型 生成 的 处 方 更 合 到 


E。 专 家 均 认为 本 文 构建 的 智能 


基础 处 方 ， 由 专业 医 J 
再 进行 调整 ， 这 相 


与 之 前 基 


处 方 生成 模型 对 临床 十 分 有 意义 ， 在 目前 所 达到 
的 阶段 其 生成 的 处 方 可 以 作为 门诊 患者 诊疗 后 的 
i 在 其 基础 上 根据 实际 情况 
可 以 大 大 提高 门诊 医师 的 诊疗 


于 机 器 学 习 的 不 区 分 病 种 的 中 医大 


数据 分 析 不 同 。 本 文 从 提升 中 医 临床 诊断 能 力 和 创 
新 发 展 需求 出 发 ， 以 肺癌 诊断 为 实际 临床 场景 ， 


探索 人 工 智 能 


译 的 问题 ， 利 用 卉 
器 输入 症状 输 


出 基于 深度 学 习 和 


将 中 医 临床 处 方 台 


在 临床 和 科研 中 的 实际 运用 。 本 文 提 
的 智能 肺癌 处 方 模型 。 本 文 巧妙 地 
生成 建 模 为 一 个 是 一 个 机 器 翻 


于 双向 循环 神经 网 络 的 自 编码 
8 中 药 组 合 ， 并 进一步 使 用 


transformer 模型 替代 RNN 作为 自 编码 模块 提升 
模型 性 能 。 根据 处 方 数据 中 药物 与 症状 关系 等 特征 ， 


入 注意 力 机 4 


3 村 和 覆盖 机 制 提升 模型 的 准确 性 和 
鲁 棒 性 。 未 来 工作 ， 将 更 多 中 医 知 知识 ， 例 如 药物 
j 量 以 及 病 证 等 加 入 生成 模型 并 引入 已 生存 期 为 


疗效 指标 ， 从 海量 中 
疗 模式 ， 建 立 智 慧 中 


医 临床 处 方 中 挖 掘 最 佳 的 诊 


医 全 周期 治疗 模型 。 
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